from llama_index.core import SimpleDirectoryReader
from llama_parse import LlamaParse
'''
需要llama云账号才可以
'''
data_dir = 'D:/pythonRoom/llm_llama/data'
parser = LlamaParse(result_type="text")
file_extractor = {".docx": parser}
reader = SimpleDirectoryReader(
    input_dir=data_dir,
    file_extractor=file_extractor
)
docs = reader.load_data()

for doc in docs:
    print(doc.metadata)
